开学特辑⑤:作为基本思维方式的反事实与假设检验 |【研究方法】专题
编者按
当我们作为本科生或者研究生迈入校园大门时,政治学的科学化浪潮已经无可避免地席卷而来(无论我们是否意识到)。因此,掌握正确的研究方法和思维方式至关重要。对于政治学乃至于社会科学来说,反事实分析和假设检验都是我们在之后的学习与工作中不可避免地组成部分,更是为我们对研究中的因果假设提供了关键的思维工具。基于此,我们编译了《政治科学中的反事实和假设检验》本篇文章,以帮助政治学初学者建立一种科学化的分析思维。这篇文章中,作者通过详细的案例分析,展示了反事实分析(if条件句)在评估因果假设中的核心作用。除此之外,文章还比较了反事实论证与实际案例比较之间的关系,以及它们在小样本量研究中的应用。
开学特辑⑤:作为基本思维方式的反事实与假设检验
(原标题为:《政治科学中的反事实和假设检验(Counterfactuals and Hypothesis Testing in Political Science)》,现标题为译者所拟)
作者:
James D. Fearon, University of Chicago
编译:
焦磊,山东大学
引文格式(MLA):
Fearon, James D. “Counterfactuals and Hypothesis Testing in Political Science.” World Politics, vol. 43, no. 2, Jan. 1991, pp. 169–95.
快速阅读(本部分基于AI生成)
反事实、实际案例比较和推理逻辑
在政治科学研究中,反事实论证与实际案例比较是两种主要的假设检验策略。当实验控制和复制不可行时,研究者可以选择这两种策略之一来评估因果假设。反事实论证涉及想象一个假设的情景,在该情景中,感兴趣的因果变量不存在或具有不同的值,进而评估结果是否会不同。另一方面,实际案例比较涉及寻找与研究案例相似但因果变量不同的其他案例,并观察结果是否存在差异。
这两种策略都试图解决由于小样本量带来的统计问题。在实际案例策略中,研究者通过查找其他案例来增加自由度;而在反事实策略中,研究者通过想象其他情况来弥补案例不足的问题。这两种方法都依赖于反事实推理,但具体的应用方式不同。
实践中的反事实论证
1. N=1的案例
在单一案例研究中,反事实论证尤为重要。例如,对第一次世界大战起源的研究中,历史学家和政治学家通过探讨如果特定因素不存在,战争是否还会发生来评估这些因素的重要性。这种论证依赖于对理性和历史背景的理解来增强其可信度。
2. N>1但仍然是小样本研究
在包含多个案例但样本量仍然较小的研究中,研究者通常会使用实际案例策略来支持他们的因果假设,但也会使用反事实论证来加强结论。例如,Gregory Luebbert 在研究欧洲战间期的政权类型时,不仅考虑了实际案例间的关联,还探讨了如果某些条件不同,结果是否会改变。
反事实和因果关系:具有实际意义的两个理论问题
研究者面临两个主要的理论挑战:一是如何确定一个事件是否是另一个事件的原因,即如果事件 A 没有发生,事件 B 也不会发生,那么 A 是否可以被认为是 B 的原因?二是哪些反事实比较更具有“合法性”或更恰当?
结论
反事实论证在政治科学研究中扮演着核心角色,尤其是在小样本量的研究设计中。它不仅是评估因果假设的常用工具,而且是理解和解释政治现象的重要组成部分。研究者应该意识到自己在使用反事实论证时的方法论基础,并尽可能明确地阐述和辩护这些论证。虽然反事实论证存在一定的不确定性,但在缺乏足够实际案例的情况下,它是评估因果关系的有效手段之一。
如果英国没有率先实现民主现代化,那么德国和日本所采用的反动方法几乎就不可能实现。如果没有资本主义和反动的经验,共产主义的方法将完全是另一回事,如果它真的会出现的话。
——Barrington Moore
核武器并没有造成两极分化的状况......即使原子从未被分裂过,美国和苏联的军事实力也将远超其他国家。
——Kenneth Walt
这些引言提供了反事实条件句的例子,即采用“如果C(或非C)的情况发生了,那么E(或非E)的情况就会发生”这一通用形式的命题。反事实条件句是对未实际发生的事件的主张。本文认为,这样的命题在政治科学家评估他们对所研究现象的原因的假设时,扮演着一个必要且基本的角色,尽管这种角色常常是隐性的且未充分发展的。特别是在小样本量的研究设计中,比较政治学和国际关系领域的学者通常通过讨论或简单提及反事实案例来评估因果假设,在这些案例中,假设的因果因素应该是不存在的。尽管这一过程相当普遍,但其方法论地位和可行性尚不清楚,值得进一步探讨。反事实论证的策略与实际案例比较为基础的假设检验方法(如回归分析或J. S. Mill的差异法)有何关系?反事实“思维实验”是评估关于国家和国际结果的假设的可行手段,还是它们在方法论上原则上无效?
本文有三个主要目标。首先,我寻求支持上述主张,即反事实命题和论证在政治科学家评估其因果假设的努力中发挥着核心作用。支持来自方法论论证和示例,这些示例展示了反事实策略在比较政治学和国际关系领域研究中的作用。我讨论了关于第一次世界大战原因、第三次世界大战未发生、社会革命、拉丁美洲民主政权崩溃以及二战期间欧洲法西斯和社团主义政权起源的文献中的例子。
其次,本文探讨了反事实论证的策略与基于实际案例比较的假设检验方法之间的关系,以及它们之间的区别。发现这两种方法密切相关:案例少而变量多的分析人员受统计原则的驱使,不得不求助于反事实论证;当使用的数据是准实验或非实验的时,反事实也似乎在证明大规模回归分析合理性的假设中发挥了关键作用。回归分析和反事实策略之间的区别不在于一个依赖于反事实,而另一个不依赖。相反,这些策略在运用反事实和评估对因果假设的支持方面有所不同。
最后,本文解决了上面提出的问题:在非实验研究环境中,反事实论证是否是评估因果假设的可行手段?我在这里没有给出明确的答案,而是介绍了一些涉及的问题和议题。我的目的既不是主张使用反事实论证优于与其他实际案例进行比较,也不是暗示反事实策略在原则上根本无效或没有价值。由于政治科学家在评估或证明因果假设时,特别是在小样本量的研究环境中,经常使用反事实论证,因此似乎很重要的是要简单理解该策略的含义。如果本文带有方法论的建议,那就是使用反事实论证来支持因果假设的研究人员应该在方法论上意识到他们在做什么,并且应该尽可能明确地阐述和捍卫他们的反事实论证。
这些总体目标分为三个部分。第一部分区分了假设检验的两种策略——实际案例的比较和反事实论证,并考察了它们之间关键的方法论异同。第二部分通过考虑国际关系和比较政治学中的例子,展示了反事实策略在实践中是如何出现的。这些例子清楚地表明,当研究人员关注一个实际案例(例如第一次世界大战的爆发或1964年巴西军事接管)时,以及当研究人员考虑几个实际案例(例如社会革命或两次世界大战之间的欧洲政权类型)时,反事实都很重要。第三部分回到了一些关于因果论证与反事实命题之间联系的理论问题,这些问题关系到反事实策略是否可行的问题。简要讨论了与反事实的使用相关的两个逻辑问题:(1)任何看似满足“如果C没有发生,E就不会发生”的事件C是否被称为“原因”或E?(2)一些反事实比较是否比其他更“合法”或适当?
反事实、实际案例比较和推理逻辑
假设C是事件E的原因。我认为,当实验控制和复制不可能时,分析师可以在两种策略之间做出选择,并且只有两种策略可以“经验地”评估这一假设。他们要么可以想象C没有出现,并询问E是否会(或可能)出现在那个反事实的情况下;或者他们可以搜索其他在重要方面与所讨论的案例相似的实际案例,除了其中一些案例中C不存在(或具有不同的值)。在后一种程序中,分析人员检查实际案例集中C和E之间的关联。如果成功(从分析人员的角度来看),这两种策略都倾向于支持所提出的原因实际上产生(或已经产生)效果的假设。
举例来说,假设国际结构性因素而非国内政治因素是苏联外交政策主要方面的主要原因。应用反事实策略的分析师将通过检查任何政权(无论是俄罗斯、苏联还是其他国家)都会做出基本相同的外交政策选择的论点来评估这一假设。使用实际案例策略的分析师会寻找与苏联俄罗斯处于相似和不同结构地位的国家案例,然后检查样本中结构位置与外交政策之间的关系。
这两种方法论策略都旨在解决相同的统计问题。我们的分析师从一个案例和至少一个解释变量开始,这意味着负自由度。合法的因果归因不能基于负自由度进行,因此希望评估因果假设或评估不同原因相对权重的分析师别无选择,只能增加或创建更多案例:要么是反事实案例(或多个案例),要么是实际案例。
换句话说,分析师在解释为什么发生某个特定事件E时,不得不解释为什么E会发生而不是其他可能的结果。这些其他可能的结果定义了分析师考虑的变化范围,在不同的研究传统中,这个范围的处理方式是不同的。例如,许多历史分析都隐含了其他可能发生的事情,而这些事情可能会因历史学家偏爱的原因而有所不同。在更多方法论上具有自我意识的小样本工作中,分析师往往更明确地说明可能发生的情况。最后,在实际案例策略中,分析师从其他实际案例中获得线索,了解可能发生的情况。因此,选举专家可以解释为什么受访者投票给共和党而不是民主党(其他实际受访者也这样做了);研究国际冲突的学生可能会解释为什么威慑在一个实际案例中失败了,而在其他情况下却没有;比较政治学的专家可能会解释为什么两次世界大战之间的德国成为法西斯独裁政权,而不是像英国那样的自由民主国家,或者(以更大范围的其他实际案例为例)像瑞典那样的社会民主主义国家,或像奥地利在Dollfuss-Schuschnigg时期那样的传统独裁政权。
反事实和实际案例策略不仅试图解决相同的统计问题,而且都存在重大的方法论风险。不太明显的是,在每种策略中,主要风险都与反事实所扮演的角色密切相关。
第一种策略的主要风险是显而易见且严重的——我们如何才能以一定程度的信心知道会发生什么?当历史学家面对他们的因果推理的有效性必然取决于反事实论证的建议时,他们常常立即拒绝或忽视这一观点,转而支持这样一种看法:他们的工作是处理现实?政治学家和社会学家,除了Max Weber被忽视的方法论部分和Jon Elster最近的一些工作外,也倾向于避免明确讨论或公开接受反事实策略,可能是因为他们认为经验主义政治学必须只处理实际案例。这种信念似乎反映在政治科学家最近出版的一本以反事实前提为基础的论文集的标题中:《What If?: Essays in Social Science Fiction》。这部“科幻”论文集在这里绝非偶然。
第二种方法策略的风险——通过考虑其他实际案例来增加自由度——也是众所周知的。在反事实方法中,人们试图想象另一个(非实际)案例,其中假定的因果主体不存在,但其他所有相关因素都是相同的;而在第二种策略中,分析师添加的实际案例可能不知道额外的案例是否适当相同。如果存在分析中未明确考虑的有关现象的其他原因,并且其中任何一种实际上与明确考虑的原因有系统关系,那么其他原因的影响将被错误地归因于正在评估的原因。简单地说,对所提出原因的影响的估计会有偏差。在统计学中,这是一个常见的问题,即自变量是否与误差项的内容相关(其中包含所有未指定、未测量的“其他原因”的影响)。这种相关性可能是由于未能包括相关的自变量、测量自变量的错误或未被认识的相互因果关系而发生的。在比较政治学文献中,经常提出的问题是研究者的几个案例是否具有可比性,或者是否充分满足了其他条件不变的假设。由于这种风险的严重性,一些分析人士倾向于对大样本或比较历史研究持怀疑态度;他们更喜欢案例研究,其中反事实策略的风险(通常是隐含的)似乎在直觉上不太严重。
人们不太了解的是实际案例策略所面临的核心风险与反事实之间的联系。虽然这篇论文主要关注反事实在小样本研究中扮演的角色,但简要介绍它们在准实验回归分析中的作用是有用的,可以作为更清楚地说明这两种策略有何不同的前奏。
为了支持对估计回归系数的因果解释,使用非实验数据的大样本分析师需要做出许多理论驱动的假设。如前所述,其中最主要的是假设解释变量和误差(其他原因)不相关。从形式上看,估计系数无偏的论点取决于E(X'e)=0的假设。很容易证明,当且仅当一个反事实命题是可信的时候,这个假设才是可信的;即:
命题P1:如果样本中的案例在自变量上具有不同的值,则误差项的内容不会系统地不同。
如果P1为假,则E(X'e)不等于零。如果E(X'e)不等于零,则Pi不能为真(Q.E.D.)。
这种说法认为,在准实验中假定E(X'e)=0就等于假定我们改变样本中任一案例的自变量值会发生何种事实命题为真。虽然人们可能不会从反事实命题的角度去思考其他条件相同(ceteris paribus)的假设,但反事实命题实际上却必须参与其中。在实际实验中,随机分配可以保证P1(在抽样方差的范围内)的真实性。在准实验中,为了对估计系数进行因果解释,需要对反事实命题的可靠性加以肯定。如果我们相信回归分析的结果,就必须相信某些前提条件。比如说,如果回答者Joe如果身为共和党而非民主党人,他在1984年选为里根总统的概率就大致会增加多少倍;又或者说,如果以色列在1970年9月没有迅速向其东北边境调派军队,那么叙利亚就不太可能被阻止对约旦首都的进攻。
如果两种确认策略都是解决同一统计问题的手段,并且都一定程度上依赖于反事实命题,那么它们之间又有何不同呢?答案是每种策略都以不同的方式为因果假设提供了“经验”证明。
在实际情况中,支持假设的因果联系策略主要表现在实际案例中关联的频率或幅度上。当然,理论驱动的假设(包括反事实假设)是支持或证明任何回归结果所必需的。但我们在回归分析中寻找的是与零假设显著不同的估计系数,这种差异源于样本中的关联频率。
而在反事实案例策略中,关联频率的评估则无法具有实际意义。由于研究人员试图进行完美的实验,除了测试因素外其他一切条件都相同,因此可以说这种关联频率无关紧要。相反,反事实策略中因果假设的支持来自于对过去可能发生的事情的论点。这些论点通过(一)引用不同于正在测试的假设的一般原则、理论、定律或规律性;(二)利用对反事实场景相关的历史事实的知识,而使其变得可信。
举一个例子来说明这一点。有人提出“进攻主义崇拜”这一观念(即欧洲军方和政界领导人普遍相信,首先发起进攻有巨大的战略优势)是第一次世界大战的重要原因。根据上述分析,检验这个假设的经验性验证有两条途径。采取实际案例策略的话,我们可以搜集一系列国际纠纷事件,其中部分事态升级为战争而部分没有。然后,我们可以从军事著作以及政客和将军关于战争期望的声明中,构建一个关于军民对先发制人优势看法的衡量标准。最后,在仔细考虑需要统计控制的独立变量后,我们可以检验支持进攻主义与事态升级之间的关联强度。为了评估这一原因对第一次世界大战可能性的贡献,我们将为这一案例中的多个独立变量设定数值,比较其对第一打击优势信念的各项贡献大小。
此外,我们可能采用反事实情况策略,该策略常被称为“案例研究”。在此情况下,严谨的研究人员会努力设想一个没有攻击崇拜但大体上类似的情况来表现战前世界。然后他们将构造论据来证明,如果没有那个情况的话,战争爆发就会小得多。这样的论据要想让人信服,就必须依据那些可以展现事件发展的原理和历史知识。Stephen 、Van Evera正是运用这种策略来支持其进攻主义的假说,基本依靠合理的通用原则来证实。他其实要问的是:如果政治家们相信防守优于进攻的话,他们会怎么做?重现什么理性的行动会产生这种信念会让我们得出这样的结论:在那场七月大危机般的情境中(也就是在反事实情境中),局势升级会不太可能发生。
由此,我们可以看到这两种假设检验方式的不同之处是显而易见的。在反事实策略中,分析者通过引用其他法律、规律或原则来支持一种因果假设,这些原则被认为具有一定的独立可信度。而在实际案例策略中,无需直接引用其他原则来支持因果假设,只需要在实际案例间联系程度足够强的论据就可以。从这种视角看,在“经验上”检查因果假设的反事实策略看似间接的经验性策略,因为它主要依靠其他理论(假定这些理论本身由实际案例比较的实证证据支持)来证实。
在更深层面上,这两种策略之间看似明显的区别似乎并不那么明显。如前所述,当在非实验环境中运用实际案例策略时,对结果进行因果解释的合理性取决于对其他未明确说明、未测量的原因的反事实假设的真实性。我们必须准备好接受这样的观点:如果变量X的值与样本中的值不同,那么因变量的其他原因也将在整体上具有明显不同。我们对自己未能左右变量深感不确定感的信任在于我们的理论是如何确立起未量化的、有关其他的理由是为什么和我们为何进行的是这种可能有关的因素的考验的关系。
在假想与实际案例策略的对比中,还有两个对比需要引起注意。第一是相对因果权重的评价。在现实案例策略中,这种评价可以通过多种方式进行,基本原理是对比不同自变量影响的估计值。最终,我们之所以能够这样做,是因为我们手头有样本,可以从中提取相关频率和幅度。而在假想策略中,我们没有具体的频率或幅度,每次引入可能影响特定待解释事件的变量的新变量时,都会遇到自由度问题。对相对影响的声明进行明确论证需要增加假想案例的数量。
例如,假设历史学家或政治学家希望论证A和B都是事件E的原因,但A比B更重要。上述分析表明,我们现在需要的不只是一个假想情景来支持这一说法,至少需要两个假想情景。我们需要对比A存在但B不存在与B存在但A不存在的假想情况,然后利用一般原则和相关事实来论证在第一种情况下E更有可能发生。
有人可能会反驳说,这种对多个假想情景下所发生的事情的争论会非常不精确和不确定。两种策略的第二个对比与“估计的精确度”这一问题有关。在现实案例策略中,当样本值很大时,频率和幅度可以让研究者对变量真实因果效应与零假设之间差异所涉及的风险大小有所了解。在假想策略中,没有正式的标准来衡量与某些自变量相关的错误风险。所有一切都取决于对可能发生的情况的合理性的争论。正如第一次世界大战起源争论的例子所示,关于可能原因的相对重要性的争论变成了关于不同假想情景相对可能性的争论。
本节分析至少从两个方面涉及了该领域当前的方法论问题。首先,比较政治学和国际关系学者常认为,当我们手头案例不多且变量众多时,统计方法便不适用,因此需要开发其他方法以做出合理解释;这些方法包括比较法、结构化、重点比较、过程追踪以及有时被称作“定性方法”的方法。根据本节的分析,我们会强调统计方法在这些情况下不适用是有原因的,即缺乏足够的案例来支持因果主张。此外,统计逻辑表明,评估一个因果主张将需要增加反事实或实际案例。当实际案例数量减少到二十个、十五个或十个以下时,统计原则就不仅仅是停止运行,这为检验因果假设提供了其他替代方式。
其次,研究人员应根据他们愿意承担的风险类型在这两种确认策略之间进行选择。有时,为支持一个因果推断所需要的反事实主张似乎完全无问题。例如,我们不需要正式的调查和回归分析来支持“心脏枪击致死”的主张。如果不是从反事实推理的角度清楚地看出国内政治动荡是促使领导层发起战争的因素,那么研究人员可能对没有明确显示出国内政治动荡与战争发动之间存在关系的回归分析持怀疑态度。如果样本识别、变量操作与衡量、相关控制等存在严重问题,那么就某一两个案例的反事实论证可能比统计方法更有说服力。
事实上,认识到一个人可以尝试解释单个案例中的反事实变化以及实际案例中的实际变化,这可能会有助于解决案例研究在方法上如何评估理论和假设的困惑。政治科学中有大量工作是分析师宣称有兴趣解释现象X(例如战争、革命、民主),选择一组X实际发生的案例,并最终得出关于现象X起因的结论。那些从事大样本分析的人往往认为这种程序是完全无效的。这种分析师“以他们的因变量来抽样”;如果他们没有包括X不发生的案例,他们如何能找到区分结果的原因?但如果我们认为每个案例研究都提出了原因,这些原因在个案中从一系列可能的反事实结果中选出了实际结果,那么我们就能理解这些分析师所说的“非Xs”和方差来源。这并不证明这种方法是正确的(尤其是这种方法通常是无意识地进行的),但它在方法论上是有意义的。
实践中的反事实论证
上面提出的最为争议的一点,或许是与在小样本环境下的论证中为证明因果论进行反向事实论点提出相关,但其非是面向小样本领域专家在众多方案中的又一项新提议。反倒是笔者相信,真实世界的自由度达到负值之时,对其进行的因果判断需要进行对反事实例子的论述来加以证实(或补充其他真实例子)。本节将通过实践考虑一些此逻辑限制的实际表现情况。
人们并不会在所有的小样本政治学研究当中发现反事实因素起核心作用。通过我翻阅文献来获取案例与证据之后得出一个印象,反事实通常出现在研究案例的肯定性工作中,以证明事件或现象发生的因果解释。当然,案例研究的目的也可以是其他目的,例如对相互对立的理论进行评估或仅是对各种理论关注的各方面信息做出反馈。另外,即使在表面上是一种案例分析时,分析师们经常也采用确认策略的双重战略。
首先,我将首先对在N=1三个案例研究的三种反事实性进行运用举例分析。在这种情景中,为明确主张存在因果关系和支持有关因果强度的论点陈述的具有因果性就须通过考虑出与之相对应的具有假定性可能发生的实例,就还需明确和接受其所必需考虑的具有假定性可能发生的实例。其次,我将考虑比较政治学中几个N>1的例子中反事实的作用。在此类情况下,分析师们经常主要使用实际案例策略来支持因果主张,但即便如此,为了完全证明推断的正确性仍需使用反事实性。
1. N=1的案例
反事实论证重要性的最清晰例证之一来自对第一次世界大战起因的研究。多年来,政治学家和历史学家们确定了大量可能的因素,通常被认为基于以下理由是起因:如果X因不存在,战争就不会发生,或者战争发生的可能性就会大大降低。因此,在争论1914年误判的因果重要性时,Robert Jervis写道:“如果参与者意识到第一次进攻不仅不会结束战争,而且会持续四年之久,他们可能就会退缩。”请注意,Jervis依靠理性原则(对战争成本的敏感度)来使从反事实命题中得出的因果推论具有可信度。
基于同样的理由,Van Evera提出了“进攻的狂热”是第一次世界大战的一个主要原因的论点。此外,他认为军事和民众倾向于美化进攻的倾向会“引发或加剧一系列次要危险”,而其他分析人士认为这些危险是独立或无关的起因。为了证明这一点,Van Evera逐一讨论了次要危险,在每个案例中,他认为如果没有进攻狂热的存在,次要原因就不会产生如此大的(或任何)影响。他的结论很好地总结了这些反事实论证。Van Evera主要依靠隐含的理性原则:他设想领导者们有不同的信念,然后得出关于这些信念下的合适或理性行为的结论。
“想象一下 1914年的政治,如果欧洲领导人认识到防御的实际力量,那么对进攻的狂热崇拜的后果就可以明白……所有欧洲国家都将不再急于首先动员起来,而且可以在对手动员之前容忍更多的准备,这样就会减缓甚至不会发生动员和反动员的螺旋式上升。如果军队开动了,他们可能会迅速冲到自己的战壕和堡垒进行防御,而不是跨越国境,将动员与战争分离。动员可以更容易地局限于单一的边界线,实现危机的地域化。英国可以更容易地警告德国并制衡俄罗斯,而所有政治家们都可以更容易地纠正或逆转在仓促行动或虚假信息中犯下的错误。因此,这会让导致1914年危机爆发的逻辑瓦解,而从巴尔干向外蔓延的战争连锁反应也将变得非常不可能。很有可能的是,奥匈帝国与塞尔维亚之间的冲突将只是一场很快被遗忘的欧洲政治边缘的小骚乱。”
Van Evera的分析中明确使用了反事实假设,因为他在方法上是有意识地提供因果解释的。这在关于第一次世界大战原因的许多历史研究著作中则不那么明显,因为关键的假定性反事实往往没有明确或未充分发展。明确处理反事实案例反过来可能具有澄清实质性辩论的优点。以手头的例子为例,Scott Sagan对Van Evera和Jack Snyder提出的论点提出了重要质疑。他认为,Van Evera和Jack Snyder“忽略了如果大国采取纯粹防御性军事纲领会带来的负面影响。” 换句话说,他对Van Evera的假定性情景提出了质疑。Sagan认为,欧洲主要大国的进攻性纲领是理性选择,用以向主要战略盟友提供更广泛的威慑,而不是仅仅或单纯地由军事组织的偏见所导致的结果。他暗示,防御性纲领可能会使国家无法代表盟友做出可信的威胁,这可能会增加爆发小规模战争的机会,从而改变对他们的权力平衡(例如,德国失去奥地利给俄罗斯,或俄罗斯失去法国给德国)。Sagan的论点中包含了使用一般原则和具体历史知识来支持反事实情景的优秀范例,以及一些巧妙运用实际案例策略来反驳他不同意的反事实主张。
另一项关于国际关系研究中反事实分析的好例子是关注一个重要现象的共存,即自1945年以来没有大国之间发生战争。根据不同理论,这个结果可能由以下任何一种原因解释:两极格局、核武器的存在、成功的平衡外交政策、或者主要战争的过时是因为大国的“荷兰化”。如果核武器或荷兰化实际上是战后军事稳定的真正或主要原因,那么我们无法用实际案例策略来检验这一点,因为这两个变量在1945年之前变化不大。John Mueller最近提出了荷兰化论点,反驳了更为广泛接受的核武器论点,这会使我们不得不讨论如果没有在这个时期发明并积聚核武器会发些什么。正如Mueller所说:
“没有核武器的战后世界可能会因二战记忆、对战后现状的超级大国的满足感、苏联意识形态的本质、以及对升级到常规战争的恐惧而相差无几。”
Mueller继续为这些“自变量”中的每一个有利于战后稳定的因素提出反事实论据。虽然他不否认核武器可能对潜在的升级起到一定的抑制作用,但他认为由于其他变量的综合影响,核武器的因果关系是多余的。关于反事实论断——没有核武器和没有大战争的战后世界——得到了某些具体历史细节(例如苏联意识形态的特点)和至少一个一般原则的支持:“战争不是出于随意的任性或空虚的幻想而开始的,而是因为一个国家或另一个国家决定从战争中获利(而不仅仅是胜利)——风险、收益和成本的结合似乎比和平更可取。” Mueller将此视为理论上可能或经验上得到证实的规律,他认为即使不考虑核武器带来的额外成本,这些年来常规战争的成本也足以阻止美国和苏联进行热战。
反事实策略在N=1案例研究中的最后一个例子来自对民主制度崩溃的研究。Stepan对1964年巴西军事政变的解释说明了比较政治学和国际关系案例研究中运用反事实的常见方式。Stepan认为,实际结果——军事政变——是由某些社会、经济和意识形态的“大政治”因素的作用促成的,但这些因素并没有使政变“不可避免”。“仍存在一个小范围的机动性,民主化和参与程度提高的过程可以在其中得到扩大。” Stepan在这里定义了他希望解释的反事实变化范围。1964年的巴西本可能看到民主的结果,但并未如此。那些缩小“机动性范围”的微观政治因素,从各种可能性中选择了威权主义的结果,被赋予了比大政治因素更高的因果地位,在Stepan看来,这些因素本身还不足以决定结果。
在处理导致政变的重大历史事件时,Stepan认为,现任总统Joao Goulart在政治战略上的选择是导致民主政权崩溃的微政治关键原因。在政治僵持的气氛中,Goulart提出重大经济和宪法改革,并寻求左翼的支持来支持这些改革,从而失去了重要的军事和中产阶级盟友。然而,“即使在宣布这些改革后的十二天里,也没有‘赢得的联盟’能推翻古拉特。”低级军官和海员发起的海军兵变随后发生,迫使Goulart必须在孤立哗变者或被高层军官疏远之间做出选择,他们将这次兵变视为对“军事纪律原则”的重大“威胁”。他对哗变者的宽容决定却意外地激发了高级军事支持政变的热情。
这两个重要的政治选择被作为政权崩溃的假想原因:如果Goulart选择不同的策略,分析表明可能就不会发生政变。这种假想对比情况得到了具体历史细节(即在他们做出选择之前军方就已经分裂且通常不支持直接军事统治)和一般原则(例如,阴谋家在行事前必须确信有足够其他重要人物的支援或无需面对他们的抵抗)的支持。
尽管Stepan对于假想对比要小心谨慎且比往常更为直言不讳,但我认为他的分析仅在部分情况下为他的因果索赔辩护是正当的,基本原因是他不愿以充分的细节展开反事实情境。关于Goulart为何选择左倾的、宪政改革策略的动机及其对接管深层次原因的说法也不够清晰。Stepan似乎暗示,Goulart的朝左倾方向的稳定之举更多地是其个人特质和抱负的结果,而非其他不可行替代选项的结果。然而,我们需要更仔细地推测如果他当初留在分崩离析、犹豫不决的联盟中会发生什么。如果从长远来看他的立场实际上是不可能的——也就是说,在现有的制度安排下,没有哪位民选领导人能够打破政治僵局——那么宏观政治因素作为因果因素的重要性就会增加。
2. N>1但仍是小样本研究
只要研究者没有比案例多出更多的独立变量(或没有出现完美多重共线性,即两个或两个以上的独立变量一起变化),他们就不必在逻辑上被迫使用反事实策略来证明因果主张。简而言之,这些条件确保了可以得出回归估计,而且在大样本研究项目中通常可以轻松满足。然而,在比较政治和国际关系领域中,研究者在拥有较少的案例和许多变量的条件下开展研究是相对频繁的。虽然在该范围中有应用实际案例策略的机会,但在这样的场景下进行数据应用很难给出对因果影响的结果预测或预测结果会非常不准确。在这种情况下,我主张通常将实际案例策略与反事实案例策略相结合,相互印证。在良好的大样本研究中,因果效应估计的可信度首先来自于充分的自由度。根据支持因果解释的理论假设,因果主张以经验的形式得到支持,就像休谟的方式一样。当样本量介于2和(例如)15之间时,规律性论证较弱,可能需要更详细个案治疗的支持。读者不仅需要了解提出的原因能正确分割几起实际案例的成果,而且要确定在这些情况下所提出的原因确实导致了他们的成果。因此人们可能会找到研究人员隐性或显性地使用反事实策略的例子,以及他们必须使用它来支持他们的因果主张的例子。
比较政治和国际关系研究中的一种常见方法论实践可以被称为“解释性因素积累法”。研究者列出了为现象的发生做出了解释的所有原因,这些都是解释所讨论的现象存在的几种情况中全部具有的情况。用形式来说就是,研究人员面对多重的共线性问题。在这样的实例中,需要通过反事实的论证来支持任何一种提出的条件具有因果影响的声明。
以Stepan在秘鲁工作上的一些观点为例来思考。他的目标是解释拉丁美洲国家建立社团主义(即法团主义)政治制度的尝试成功或失败。他确定了五个独立变量,并给出了将每个变量与成功或失败的可能性联系起来的一般假设。然后这五个变量分别证明了接下来的结论,它们是如何实际区别于成功与失败的案例的:所有情况都是对社团制度的成立都起作用的情况下,这种成立会获得成功;而在这种方案最不可能出现时则反面发生。在此需要说明的是,如果没通过对比假设来进行讨论,我们就无法判断哪些变量起了作用,无法确定具体是哪个或多少个因素起作用。也许实际上只有一个或两个因素起关键作用,其他都是无关紧要的因素。仅有两种决定的方式:(1)发现新实例情况:仅让一种解释性因素出现,而让其他不出现;(2)就已出现的现实情况来看,若无该因素就应当为团体社会性的成功做出不同的对比解释。当进行多个原因共同对结果的解释时,“众原因同”往往更加普遍。以Barrington Moore所具有代表性研究的几篇巨作来讲明此种操作案例实体的证明——就像找出影响民主化发展中最关键五大“主要条件”的列表一样。
对比假设同样可以在名义上参与实际案例工作,当分析者使用历史方法处理特定案例时,以做出基于实际案例关联的可靠声明。例如,Theda Skocpol找出了三个关键变量,以此来区分她关于“积极案例”的社会革命(1789年的法国、1917年的俄国和1911-1949年的中国)和未发生社会革命的实际案例(例如明治时期的日本、十七世纪的英国、1807年和1848年的普鲁士、俄国在克里米亚战争后的时期以及1905年、十八世纪初期的法国)。Theda Skocpol并没有简单地陈述不同案例中独立变量的值,并表明它们如何区分结果,而是对每个积极案例进行了较为详尽的历史性处理,详细说明了她的独立变量是如何在每个案例中产生社会革命的。虽然Theda Skocpol在历史分析中频繁地采用了实际的案例策略,但其手法和巴西Stepan例子非常相似——那些独立的变量都可以根据特定的可能从多个选择中提取出某一实际性事实来鉴别开结果差异的不同历史时代背景。
Gregory Luebbert 在一个小样本的研究环境中,典范性地运用了实际案例分析方法,并提供了一些如何在这种分析中使用反事实策略的最终示例。Luebbert 首先确定了两个独立变量,这两个变量完美地划分了他对欧洲战间期政权类型的十四个实际案例。“多元民主”只出现在那些自由党在第一次世界大战前获得主导地位的国家中。其他地方的政权类型则由哪个政党成功与农村“中间农民”形成联盟来决定:如果是社会主义者,那么结果就是“社团民主”;如果是自由党,那么就是“传统独裁”;如果都不是,那么就是法西斯主义。Luebbert 并没有详细探讨联盟成员和政权类型之间的因果关系。在论证第一次世界大战的影响使得英国和法国式的多元民主在其他地方变得不太可能时,他确实探讨了以下反事实:“在意大利、挪威和瑞典,再有一代人的和平可能会导致多元民主政权的出现。”但总体而言,他满足于让完美的关联性和直观上可以接受的联盟成员决定政策政权类型的观点来支持他的因果论断。
相反,Luebbert 将他的分析重点转向识别“促成这些联盟的条件”。由此推断,这些条件将是政权类型的最终或更深层次的原因。这一努力既体现了实际案例的比较,也隐含了反事实的论证。对于后者的例子,可以考虑 Luebbert 对挪威和丹麦社会主义政党为什么与中间农民结盟而不是与农业无产阶级结盟的解释(从而产生了社团民主)。他指出,在挪威,几乎没有无地劳动者,因此他们并不是社会主义者动员的诱人目标。Luebbert 并没有通过比较多个实际案例中农村工人群体规模与社会主义动员努力的相关性,而是简单地诉诸一个理性原则来支持适当的反事实论证。在丹麦,社会主义者无法动员数量庞大的农业劳动者群体,因为“这个群体已经被另一个政党大量动员了。”因此,他们动员了中间农民,导致了社团主义联盟。隐含的反事实是:如果农业劳动者群体没有被动员,那么可能会被社会主义者动员,结果就会是法西斯主义而非社团主义。因此,丹麦战前政治的一个特定事实成为了该国社团主义而非独裁或法西斯主义的最终原因。
反事实和因果关系:具有实际意义的两个理论问题
关于通过想象某一特定历史事件的(反事实的)缺失效果来确立其原因的命题,早已有过论述。在仍然被认为是该主题最佳的论文之一中,韦伯强烈主张承认因果解释与反事实在历史研究中的关联。他指出:
“假如俾斯麦未曾决定发动[1866]年的战争,那么历史将会如何发展的这一问题,绝不是一个‘无意义’的问题(与历史学家Eduard Meyer的看法相反)。确实,它关乎对历史现实塑造的决定性问题,即在无数‘因素’的整体背景下,合理地归因于这一特定决策的因果意义。”
由于Weber长期以来被社会学家和政治学家视为方法论导师,因此这一特定论文未能得到广泛讨论和明确应用是有些令人惊讶的。近年来,关于反事实角色的唯一严肃且持久的辩论发生在历史学家之间(且未引用Weber),他们讨论一些“新经济史”学者对反事实的使用。我所知唯一深入研究这一主题的政治学家是Elster,特别是在他的《Logic and Society》中。他提出了一种新颖的“分支世界”理论,用于评估反事实命题的有效性,并用它分析了一些经济史的例子。当然,在社会科学之外,分析哲学家多年来一直在研究反事实和因果关系。虽然其中很多文献(例如关于形态学的形而上学部分)看起来与社会科学家并无多大相关性,但历史哲学家关于反事实和解释的一些最新工作具有实际价值,可能应当受到更多关注。
研究反事实的学者们常常对这类命题所涉及的逻辑和哲学问题表示沮丧、怀疑和困惑。本节简要介绍了两个似乎特别令社会科学家和历史学家困扰的问题。第一个有时被称为“Cleopatra的鼻子问题”。根据帕斯卡尔的说法,如果Cleopatra的鼻子更短一些,安东尼可能不会如此迷恋她,西方历史的进程可能也会不同。这是否意味着控制克利奥帕特拉鼻子长度的基因是第一次世界大战的一个原因?更一般来说,如果我们认为事件A满足:
P2:如果A没有发生,B就不会发生,那么我们是否必须说A是B的原因呢?
这不仅仅是一个空洞的问题。如我们所见,社会科学家们常常依据确切的理由辩称,A是B的原因——即如果A没有发生,B可能也不会发生。如何在无穷无尽的具体因素中区分开来,这些因素若未发生则会阻止或减少某个有趣事件发生的可能性呢?
一种方法是认为因果关系不应按像P2这样的反事实来定义,即“A满足P2”并不意味着A是B的原因。考虑这样一种观点:原因是指每当(或通常当)发生时都会产生其效果的事物。从这个意义上说,进攻文化可以被理解为催生了第一次世界大战,但克利奥帕特拉的鼻子却不符合这种理解。这一策略等同于接受常规性因果论。偶然的事件仅仅是导致特定事件的“条件”,而不是真正的“原因”;能概括或常规地产生效果的特定事件的条件则被称为原因。这种区分对于进行小样本研究的政治科学家,特别是个案研究,可能是有用的。然而,这种区分也可能与常识和日常用法相冲突,例如:倒下的瓦片并不是导致不幸者死亡的“原因”,造成死亡的是颅骨骨折;瓦片只是一个“条件”。
另一种方法会对某些偶然发生的事情较为宽容。我们可以辩称,Cleopatra鼻子的长度并没有使第一次世界大战的发生比其它可能的世界更有可能,而进攻文化的存在却显著地“选定了”第一次世界大战这个特定结果。也就是说,同样的理论论证表明,条件是Cleopatra的鼻子较短的情况下,第一次世界大战的发生概率为零,这表明在她鼻子如原状的条件下,第一次世界大战发生的概率也几乎为零。根据这种说法,一件偶然(或“随机”)发生的事情——比如猴子咬死了一位国王,而他的继任者发动了一场战争——可以被认作是特定事件的“原因”。重要的是,在这两种说法中,满足P2的事件不一定是所解释现象的原因。尽管像P2这样的反事实命题可能被用来支持因果关系的主张,但原因不仅仅是满足P2。对于通过反事实主张因果关系的政治科学家而言,这两个建议都可能具有实际价值。
学者面临的第二个令人困惑的问题涉及Elster所谓的反事实命题的“合法性”。Elster认为,如果我们有一个理论表明反事实前提不可能发生,那么为评估因果假设而进行的反事实思想实验是不合法的。假设我们想了解铁路对19世纪美国国民生产总值增长的影响,并试图通过想象没有铁路的上个世纪来做到这一点。Elster认为,推测内燃机是否会比实际发明得更早(在没有铁路的19世纪美国)是无意义的,因为回答这一问题需要一个足够强大的技术变革理论,以至于使最初的反事实命题变得不合理。如果我们能够预测内燃机是否会被更早发明,那么我们也必须有一个理论表明铁路“必须”在当时被发明。Elster称之为“剪刀问题”或“不可避免的不重要性”:我们的理论越好,我们知道的“必须发生”的事情就越多,因此我们可以合法断言的反事实也就越少。
在社会科学实践中,这个问题常常以以下形式出现:基于实际案例比较,一个比较研究专家声称C在X国引起了E,暗示如果C不同,那么X国的结果可能会更像Y国的结果。X国的专家对此批评为荒谬,认为由于X国特有的复杂历史和文化因素,C不可能是不同的。
坚持反事实命题“合法”可能混淆或至少掩盖两个不同的问题。真正的问题不是合法性(如果这意味着我们在反事实假设中不能合法地改变那些必须发生的原因)。C事件是否必须发生与它相对于E的因果地位没有直接关系。一个变量可能帮助解释一个结果,同时它本身也可以被其他变量的作用所解释。在大样本研究中,这种模式常见于结构方程模型,其中一个方程中的因变量可能在另一个方程中是自变量。
关键问题在我看来是哲学家Nelson Goodman所称的“共同持有性”。根据Goodman的描述,如果(1)非事实的前提与适当的理论和事实结合后能推导出结论,并且(2)非事实的前提与用来推导推论的事实或“初始条件”是“共同持有”的,那么非事实断言就被判断为真实。也就是说,如果前提实际发生了,那么初始条件也可以同时发生。因此,在他对进攻崇拜假说的批评中,Sagan实际上是认为,假设没有进攻崇拜与假设一个与实际1914年完全相同的1914年是不共同持有的。如前所述,他暗示防御优势的信仰会为国家领导人创造一个不同的战略问题,这同样可能导致战争。
那么问题不是某个因素必须发生,而是改变这个因素是否意味着还要改变其他也会实质上影响结果的因素。不应通过说前提不可能发生来批评非事实论证,而是需要一个明确的论证表明,如果前提成立,那么在非事实情境中需要其他改变,这些改变会以不同的方式影响结果。
由此产生一个显而易见的方法论建议:使用非事实论证策略的分析者,应该密切注意自己的非事实假设,是否与用来得出因果推论的事实和理论共同持有。这也许是对什么使一个非事实论证看似合理的更精确陈述。我预计在实践中,共同持有性要求对小的原因如具体政策决策来说更容易满足,而对大的原因如民族主义、帝国主义或进攻崇拜则不易。历史经常提供证据表明,在某些关头领导人考虑了几种可能的选择,在某些情况下可以设想做出不同的选择而不会改变对问题结果的其他主要影响。非事实假设与现实世界不同的地方越少,就越容易做出因果推论并支持它们,这些推论也就越有说服力。
结论
反事实及其在假设检验中的策略在政治科学家评估因果假设的努力中发挥了重要但往往未被承认和开发不足的作用。我试图表明,任何提出因果关系的非实验研究,无论是大样本研究还是小样本研究,都必须面对反事实——无论是以关键假设的形式,还是通过使用假设性比较案例。特别是在小样本研究中,变量过多而案例过少的常见情况使反事实思维实验成为对因果关系主张进行严肃证明的必要手段。我以两条简单的建议结束本文,这些建议是针对通过反事实论证而非实际案例样本中的关联性来评估因果主张的分析师。
首先,小样本分析师可以通过明确支持其假设所需的反事实情景,来加强(或仅仅指定)其因果论据。通常情况下,比较政治学和国际关系领域的研究人员声称,他们的因变量是X,即某一特定事件或现象。X可能是美国未能在世界大战期间扮演国际霸主角色、核扩散体制的变化、日本自由民主党的主导地位,或东欧共产主义的崩溃。解释此类事件的分析师需要明白,这些都不是变量。如果确定了替代的反事实情景或加入了一些实际情况中的不同结果,那么它们才成为变量的值。无论出于何种原因,如果有人不愿意添加实际案例,那么就必须明确如果某个可能的原因变化了会发生什么。反事实比较案例不需要详尽细致——只需指明——让读者知道理论或假设试图解释的变化是什么。
第二个关键步骤是使从反事实比较中得出的推论具有辩护力。有时,一个反事实命题隐含的论证十分明显,几乎无需展开。然而其他时候,特别是在对假设进行评估时,分析师应明确支持该假设的论据及其支持方式。分析师需要问,因果推论是否确实符合用于描述比较案例的理论和历史事实,然后,反事实命题与反事实情境是否相容。如果反事实声明是真实的(例如,如果不存在攻击崇拜),就不会有其他事情不同以致实质性地影响结果。
当然,我们永远无法确定如果C不同,还会有什么也不同。但是,我们或许可以提出一些论据,根据我们对历史细节的使用和关于人类行为方式的理论,来判断这些论据是更可信还是不那么可信。我必须强调,我并不是建议有一种特殊的方法来精确确定究竟会发生什么。我也不主张建立一种新的方法来与既定的假设检验方法抗衡。相反,我的意图首先是表明,在非实验假设检验中无法避免反事实,然后阐明它们的角色,最后建议政治科学家在使用反事实时,应明确而谨慎地进行。
(因篇幅限制,参考文献从略)
〇 编辑、排版:焦磊
〇 审校:郭瑞涵 大兰